Xiangyu Fu's Website

share my projects and ideas

  • Home
  • archives
  • tags
  • about
  • 搜索

Xiangyu Fu

undergraduate in Germany, interested in artificial intelligence and robots

12 文章
3 分类
3 标签

强化学习 标签

10-15 强化学习(六) - 连续空间中的强化学习(RL in Continuous Spaces)及相关实例

10-15 强化学习(五) - 时序差分学习(Temporal-Difference Learning)及其实例----Sarsa算法, Q学习, 期望Sarsa算法

10-14 强化学习(七) - 函数近似方法 - 随机梯度下降, 半梯度下降,及瓦片编码(Tile Coding)实例

10-14 强化学习(四) - 蒙特卡洛方法(Monte Carlo Methods)及实例

08-22 强化学习(三) - Gym库介绍和使用,Markov决策程序实例,动态规划决策实例

08-22 强化学习(二)- 动态规划(Dynamic Programming)

08-22 强化学习(一)- 强化学习介绍、Markov决策过程和贝尔曼期望方程

08-22 强化学习(四) - 蒙特卡洛方法(Monte Carlo Methods)及实例

Powered by Gridea | © 2019-2020 Theme By HsxyHao
Do not multiply entities beyond necessity.
0条相关条目,使用了0毫秒
强化学习(九)- 策略梯度方法 - 梯度上升,黑箱优化,REINFORCE算法及CartPole实例
强化学习(八) - 深度Q学习(Deep Q-learning, DQL,DQN)原理及相关实例
强化学习(七) - 函数近似方法 - 随机梯度下降, 半梯度下降,及瓦片编码(Tile Coding)实例
强化学习(六) - 连续空间中的强化学习(RL in Continuous Spaces)及相关实例
强化学习(五) - 时序差分学习(Temporal-Difference Learning)及其实例----Sarsa算法, Q学习, 期望Sarsa算法
强化学习(七) - 函数近似方法 - 随机梯度下降, 半梯度下降,及瓦片编码(Tile Coding)实例
强化学习(四) - 蒙特卡洛方法(Monte Carlo Methods)及实例
强化学习(三) - Gym库介绍和使用,Markov决策程序实例,动态规划决策实例
强化学习(二)- 动态规划(Dynamic Programming)
强化学习(一)- 强化学习介绍、Markov决策过程和贝尔曼期望方程
强化学习(四) - 蒙特卡洛方法(Monte Carlo Methods)及实例
【从零开始的ROS四轴机械臂控制】(一)- 实际模型制作、Solidworks文件转urdf与rviz仿真
About